#-*- coding:utf-8 -*-
from pip.download import user_agent
import urllib2
from errno import ETXTBSY

class Spider:
    '''
        内涵段子吧的一个爬虫类
    '''
    def load_page(self, page):
        '''
            发送内涵段子URL请求，得到html源码
        '''
        url="http://www.neihan8.com/article/list_5_"+str(page)+".html"
        user_agent="Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; TRIDENT/5.0;"
        headers={"User-Agent":user_agent}
        req=urllib2.Request(url, headers=headers)
        response=urllib2.urlopen(req)
        html=response.read()
        
        return html

def write_to_file(file_name, txt):
    '''
        将txt文本存入到file_name文件中
    '''
    print "正在保存文件"+file_name
    #1.打开文件 
    f=open(file_name, 'w')
    #2.写入到文件
    f.write(txt)
    #3.关闭文件 
    f.close()





if __name__=="__main__":   
    #创建一个爬虫对象
    mySpider=Spider()
    the_page=mySpider.load_page(1)
    
    file_name=str(1)+".html"
    
    write_to_file(file_name, txt)
    



